ข้อมูลเชิงลึกสำหรับผู้เชี่ยวชาญด้านเครือข่าย
ArubaOS-CX เป็นระบบปฏิบัติการเครือข่ายที่ทันสมัยสำหรับสวิตช์ Aruba CX Series ซึ่งเน้นสถาปัตยกรรมแบบโมดูลาร์และโปรแกรมได้ เซอร์วิส `hpe-restd` และ `yang-resolverd` มีบทบาทสำคัญในการจัดการและการทำงานของสวิตช์เหล่านี้ ส่วนนี้จะอธิบายถึงสถาปัตยกรรมของ ArubaOS-CX และหน้าที่หลักของเซอร์วิสทั้งสอง
ArubaOS-CX ถูกสร้างขึ้นด้วยแนวทาง "Cloud-Native" เป็นระบบแบบโมดูลาร์ สามารถโปรแกรมได้ ยืดหยุ่นสูง และทนทานต่อความผิดพลาด ใช้รูปแบบไมโครเซอร์วิส โดยฟังก์ชันต่างๆ ถูกแบ่งการทำงานไปยังเดมอนที่แยกจากกัน มีฐานข้อมูลสถานะพร้อม REST API 100% ทำให้สามารถโปรแกรมและทำงานอัตโนมัติได้สมบูรณ์ ช่วยให้รีสตาร์ทเซอร์วิสเฉพาะส่วนได้โดยไม่กระทบทั้งระบบ โดยเฉพาะระนาบข้อมูล (data plane)
เดมอน HPE REST (`hpe-restd`) เป็นเซอร์วิสสำคัญในระนาบการจัดการ มีหน้าที่หลัก:
ความเสถียรของ `hpe-restd` สำคัญต่อการจัดการระยะไกลและระบบอัตโนมัติ
เดมอน `yang-resolverd` จัดการและซิงโครไนซ์ข้อมูลของสวิตช์ตามโมเดลข้อมูล YANG มีหน้าที่หลัก:
`yang-resolverd` สำคัญต่อความแม่นยำของระบบตรวจสอบและจัดการเครือข่าย ปัญหาเกี่ยวกับเดมอนนี้อาจนำไปสู่ข้อมูลที่ทำให้เข้าใจผิดในแดชบอร์ดการจัดการ
การรีสตาร์ทเซอร์วิสใดๆ บนสวิตช์ในสภาพแวดล้อมการทำงานจริงควรดำเนินการด้วยความระมัดระวัง ส่วนนี้จะสรุปข้อควรปฏิบัติเพื่อลดผลกระทบที่อาจเกิดขึ้น
ข้อควรจำ: การรีสตาร์ทเซอร์วิสโดยขาดความรอบคอบอาจนำไปสู่การหยุดชะงักของการจัดการหรือบดบังปัญหาที่แท้จริงได้
ส่วนนี้จะให้รายละเอียดเกี่ยวกับฟังก์ชัน, สถานการณ์ที่ควรพิจารณารีสตาร์ท, ขั้นตอนการวินิจฉัย, วิธีการรีสตาร์ท, และผลกระทบของการรีสตาร์ทเซอร์วิส `hpe-restd`
`hpe-restd` เป็นศูนย์กลางสำหรับอินเทอร์เฟซการจัดการภายนอก จัดการการรับรองความถูกต้องเซสชัน REST (Event ID 4602/4601), เซสชันผู้ใช้ (Event ID 4604/4605), และการให้สิทธิ์ (Event ID 4607/4608/4606) นอกจากนี้ยังเกี่ยวข้องกับการเชื่อมต่อ Aruba Central (Event ID 4632/4639 สำหรับการเชื่อมต่อ, 4633/4634 สำหรับการตัดการเชื่อมต่อโดย Central, 4637 สำหรับข้อผิดพลาดภายใน) และการจัดการใบรับรองผ่าน WebUI
ควรรวบรวมข้อมูลต่อไปนี้ *ก่อน* การรีสตาร์ท:
คำสั่ง | Context | รายละเอียด/วัตถุประสงค์ |
---|---|---|
show version | > หรือ # | ตรวจสอบเวอร์ชันเฟิร์มแวร์ |
show aruba-central (หรือ show hpe-anw-central ) | > หรือ # | ตรวจสอบสถานะการเชื่อมต่อ Aruba Central |
show events -d hpe-restd -r -n 50 | # | แสดง Log 50 รายการล่าสุดจาก `hpe-restd` |
show security-logs -d hpe-restd -r -n 50 | # | แสดง Security Log 50 รายการล่าสุดจาก `hpe-restd` |
show core-dump | # | ตรวจสอบ Core Dumps จาก `hpe-restd` |
diag-dump rest basic | # | รวบรวมข้อมูลวินิจฉัยพื้นฐานของ REST feature |
show system resource-utilization | > หรือ # | ตรวจสอบการใช้งาน CPU และหน่วยความจำ |
debug rest all [severity error] | # | เปิดใช้งาน Debug Log (ใช้ด้วยความระมัดระวัง) |
ส่วนนี้จะให้รายละเอียดเกี่ยวกับฟังก์ชัน, สถานการณ์ที่ควรพิจารณารีสตาร์ท, ขั้นตอนการวินิจฉัย, วิธีการรีสตาร์ท, และผลกระทบของการรีสตาร์ทเซอร์วิส `yang-resolverd`
`yang-resolverd` รับผิดชอบความสมบูรณ์และการซิงโครไนซ์ข้อมูลที่สร้างแบบจำลองด้วย YANG ของสวิตช์กับระบบภายนอก (โดยเฉพาะ Aruba Central) ทำให้มั่นใจว่าโครงสร้างข้อมูลที่แสดงสถานะสวิตช์ (เช่น ตารางไคลเอ็นต์) ได้รับการประมวลผลอย่างถูกต้อง
การวินิจฉัยมักอาศัยการสังเกตอาการในระบบภายนอก:
อาการ/ตัวชี้วัด | ส่วนที่น่าจะได้รับผลกระทบ | บันทึก/คำสั่งที่เกี่ยวข้อง |
---|---|---|
รายการไคลเอ็นต์ไม่แสดง/ไม่ถูกต้องใน Central | การซิงโครไนซ์ข้อมูล | `show aruba-central`, Central UI, Event Logs |
ข้อมูลสวิตช์ล้าสมัยใน NMS | การประมวลผล/ซิงค์โมเดลข้อมูล | NMS Logs/Status, Event Logs สวิตช์ |
ข้อผิดพลาด "Subscription not found" (คาดการณ์) | การจัดการ Subscription YANG | Event Logs, NMS Logs |
ตรวจสอบ `show version` และ `show events -r -n 50` ด้วย
ArubaOS-CX ใช้ `systemd` เป็นระบบ init และตัวจัดการเซอร์วิส ซึ่งเป็นมาตรฐานใน Linux สมัยใหม่ ส่วนนี้อธิบายภาพรวมการทำงานของ `systemd` และคำสั่ง `systemctl restart`
`systemd` รับผิดชอบในการเริ่มต้น, หยุด, ตรวจสอบ, และจัดการเดมอน (เซอร์วิส) ของระบบ เซอร์วิสต่างๆ ถูกกำหนดใน unit files ซึ่งระบุวิธีการจัดการ, การขึ้นต่อกัน (dependencies), และวิธีการเริ่มต้น/หยุด
เมื่อรันคำสั่ง `systemctl restart
ขั้นตอน | การดำเนินการโดย `systemd` | สัญญาณ | เวลารอ (ค่าเริ่มต้น) | วัตถุประสงค์ |
---|---|---|---|---|
1. พยายามหยุดอย่างนุ่มนวล | ส่งสัญญาณยุติการทำงาน | SIGTERM | 90 วินาที | อนุญาตให้เซอร์วิสปิดระบบอย่างสะอาด |
2. หมดเวลา & บังคับหยุด | หากไม่สิ้นสุดหลังหมดเวลา | SIGKILL | N/A | บังคับยุติเซอร์วิสที่ไม่ตอบสนอง |
3. เริ่มการทำงาน | เริ่มเซอร์วิสใหม่ | N/A | N/A | ทำให้เซอร์วิสกลับมาออนไลน์ |
`systemd` จัดการการขึ้นต่อกันระหว่างเซอร์วิส การรีสตาร์ทเซอร์วิสหนึ่งอาจส่งผลต่อเซอร์วิสที่ขึ้นต่อกัน การปิดระบบอย่างนุ่มนวล (จัดการ `SIGTERM`) สำคัญสำหรับเซอร์วิสที่ต้องการรักษาสถานะ ขอบเขตที่ `hpe-restd` และ `yang-resolverd` รักษาสถานะระหว่างรีสตาร์ทขึ้นอยู่กับการออกแบบภายใน (เอกสารทางการไม่ได้ให้รายละเอียด)
เมื่อการรีสตาร์ทเซอร์วิสไม่สามารถแก้ไขปัญหาได้ หรือปัญหาเกิดขึ้นซ้ำๆ แสดงว่ามีปัญหาที่ซับซ้อนกว่านั้น ส่วนนี้จะแนะนำขั้นตอนต่อไป
หากการรีสตาร์ทไม่ช่วยแก้ปัญหา หรือปัญหาเกิดซ้ำ บ่งชี้ถึงปัญหาพื้นฐานที่ยังอยู่ อาจเกิดจาก Firmware Bug, Resource หมด, Config ขัดแย้ง, หรือปัญหา Hardware
เตรียมข้อมูลการวินิจฉัยทั้งหมด รวมถึง:
การทำความเข้าใจบทบาทและการจัดการเซอร์วิส `hpe-restd` และ `yang-resolverd` บนสวิตช์ ArubaOS-CX เป็นสิ่งจำเป็นสำหรับวิศวกรเครือข่าย การรีสตาร์ทเซอร์วิสเหล่านี้เป็นเทคนิคการแก้ไขปัญหาขั้นสูง ซึ่งควรทำด้วยความระมัดระวังและเมื่อมีเหตุผลอันสมควร
สถาปัตยกรรมแบบโมดูลาร์ของ ArubaOS-CX ช่วยให้สามารถรีสตาร์ทเซอร์วิสเป้าหมายได้ ซึ่งเป็นข้อได้เปรียบในการปฏิบัติงาน ช่วยลดเวลาหยุดทำงานของการจัดการและเพิ่มความพร้อมใช้งานของเครือข่ายโดยรวม